为满足商业和科学应用的深度学习的极端计算需求,Dataflow加速器越来越受欢迎。虽然这些“特定于域的”加速器不是完全可编程的CPU和GPU,但它们对数据编程,即数据流和平铺优化来保持不同的灵活性,以提高效率。在设计新的算法和映射方法时,在新硬件上执行目标问题的算法存在若干挑战。以前的作品单独解决了这些挑战。为了解决整体挑战,在这项工作中,我们在流行的MLIR编译基础架构中,我们为一个名为Union的空间加速器提供了HW-SW Co-Design生态系统。我们的框架允许在几种加速器成本模型上探索不同的算法及其映射。联盟还包括一个加速器成本模型和映射器的即插即用库,可以轻松扩展。算法和加速器成本模型通过新颖的映射抽象来连接,该抽象捕获空间加速器的地图空间,该空间加速器可以基于来自硬件,工作负载和映射器的约束来系统地修剪。我们展示了与多个案例研究的社区联盟的价值,该研究将使用不同的映射方案在不同的加速器架构上卸载不同的张量操作(Conv / Gemm / Tensor收缩)。
translated by 谷歌翻译
焊接联合检查(SJI)是生产印刷电路板(PCB)的关键过程。在SJI期间发现焊料错误非常具有挑战性,因为焊接接头的尺寸很小,并且可能需要各种形状。在这项研究中,我们首先表明焊料的特征多样性低,并且可以作为精细颗粒的图像分类任务执行SJI,该任务侧重于难以固定的对象类。为了提高细粒度的分类精度,发现通过最大化熵来惩罚自信模型预测,在文献中很有用。与此信息内联,我们建议使用{\ alpha} -skew Jensen-Shannon Divergence({\ alpha} -js)来惩罚模型预测的信心。我们将{\ alpha} -js正则化与现有基于熵指定的方法和基于注意机制,分割技术,变压器模型和特定损耗函数的方法进行比较。我们表明,在细化的焊料联合分类任务中,所提出的方法可以达到不同模型的F1得分和竞争精度。最后,我们可视化激活图,并表明,凭借熵的规范化,更精确的类歧视区域是局部的,这也更适合噪声。接受代码将在这里接受。
translated by 谷歌翻译
自我监督图像生成中普遍的方法是在像素级表示上操作。尽管这种方法可以产生高质量的图像,但它不能从矢量化的简单性和先天质量中受益。在这里,我们提出了一个以图像的冲程级表示作用的绘图代理。在每个时间步骤中,代理商首先评估当前画布,并决定是停止还是继续绘画。当做出“抽奖”决定时,代理输出一个程序,指示要绘制的中风。结果,它通过使用最小数量的笔触并动态决定何时停止,从而产生最终的栅格图像。我们通过对MNIST和Omniglot数据集进行强化学习来培训我们的代理,以无条件生成和解析(重建)任务。我们利用我们的解析代理在Omniglot挑战中进行典范生成和类型的条件概念生成,而无需进行任何进一步的培训。我们在所有三代任务和解析任务上提供了成功的结果。至关重要的是,我们不需要任何中风级别或矢量监督;我们只使用栅格图像进行训练。
translated by 谷歌翻译